FILTER MODE ACTIVE

#многоязычный бенчмарк

Найдено записей: 1

#многоязычный бенчмарк23.04.2025

AWS запускает SWE-PolyBench: многоязычный бенчмарк для оценки AI-агентов программирования

AWS AI Labs представил SWE-PolyBench — новый открытый многоязычный бенчмарк для оценки AI-агентов программирования на реальных задачах из популярных языков программирования.